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DESCRIPTION 

Domaine de I'invention 

L'invention concerne un procede de recherche dans un ensemble d'objets d'un nombre 
predetermine d'objets les plus proches d'un exemple. L'invention concerne egalement un 
programme d'ordinateur et un equipement comportant des moyens de mise en oeuvre d'un tel 
5 procede de recherche. Elle concerne enfin un systeme de transmission comportant un tel 
equipement. 

L'invention a d'importantes applications dans le domaine de I'exploitation des donnees 
de type audio/video. 

Les capacites de transmission et de stockage d'informations augmentent de facon 
10 considerable, si bien que dans de nombreux domaines, y compris dans le domaine de 

I'electronique grand public, I'utilisateur a desormais des difficultes pour gerer I'information dont il 
dispose. Dans ce contexte, les methodes de recherche d'objets prennent une importance 
croissante. 

15 Arriere plan technoloaique de l'invention 

Le brevet americain 5,832,182 decrit des precedes de partition de donnees et evoque 
I'interet de tels procedes pour faire de la recherche. La partition des donnees permet en effet de 
reduire le nombre de comparaison a effectuer pour faire une recherche, et done le temps de 
traitement necessaire a la recherche. 

20 

Resume de l'invention 

L'invention a notamment pour but de proposer un procede efficace de recherche 
d'objets en utilisant une partition d'objets a plusieurs niveaux. 

Un procede de recherche selon I'invention est remarquable en ce que, pour rechercher 
25 dans un ensemble d'objets un nombre predetermine d'objets les plus proches d'un exemple, en 
utilisant une partition a plusieurs niveaux qui a une structure arborescente comportant des 
nceuds et des feuilles, les nceuds contenant des elements representatifs de classes d'objets, et 
les feuilles contenant des objets,.il comporte les etapes suivantes: 

- une etape de parcours de ladite structure arborescente a partir d'un nceud, vers des feuilles, 
30 en passant par les nceuds dont les elements representatifs sont les plus proches de I'exemple, 

pour selectionner une ou plusieurs feuilles, 

- une etape de test pour verifier si le nombre de feuilles selectionnees est inferieur audit nombre 
predetermine d'objets, 

- et, si le nombre de feuilles selectionnees est inferieur audit nombre predetermine d'objets, une 
35 nouvelle iteration desdites etapes, a partir du nceud frere du dernier nceud parcouru, le plus 

proche dudit exemple. 



L'utilisation d'une partition a plusieurs niveaux est particulierement avantageuse pour 
faire de la recherche, parce qu'elle permet de reduire encore le nombre de comparaisons 
necessaires a la recherche, et done le temps de traitement. Elle permet aussi de traiter des 
ensembles comportant un nombre d'objets beaucoup plus important qu'avec une partition a un 
seul niveau. En effet, avec une partition a un seul niveau, lorsque la taille de I'ensemble d'objets 
augmente de fagon significative, cela entraine soit I'augmentation du nombre de classes, soit 
I'augmentation du nombre d'objets contenus dans une classe. Dans les deux cas, on est amene 
a comparer I'exemple recherche a un beaucoup plus grand nombre d'objets. Le temps de 
traitement augmente done considerablement. En revanche, avec une partition multi-niveaux, 
I'exemple recherche n'est compare qu'a un nombre restreint d'objets a chaque niveau de la 
partition. L'augmentation de la taille de I'ensemble a done beaucoup moins d'influence sur le 
temps de traitement de la recherche. 

L'invention propose une fagon avantageuse de parcourir la structure arborescente d'une 
partition a plusieurs niveaux. 

Dans un mode de realisation avantageux de l'invention, le nombre predetermine d'objets 
est un multiple d'un nombre predetermine de resultats, et ledit procede comporte une etape 
supplemental de selection pour ne retenir, parmi les feuilles selectionnees, qu'un nombre de 
feuilles egal audit nombre predetermine de resultats, les feuilles retenues etant celles qui 
contiennent les objets les plus proches dudit I'exemple. 

La partition des objets a pour effet de reduire le nombre de comparaisons a effectuer 
pour faire une recherche. Mais elle enframe necessairement une deterioration des resultats de la 
recherche. Ce mode de realisation permet de limiter cette deterioration. En effet, le fait de 
selectionner dans un premier temps un nombre de feuilles superieur au nombre de resultats 
souhaite, puis d'effectuer une selection complementaire, par exemple par comparaison 
exhaustive des objets contenus dans les feuilles selectionnees avec I'exemple recherche, permet 
d'ameliorer de fagon notable la qualite des resultats obtenus. 

D'une fagon generale l'invention est applicable a tout type d'objet des lors qu'une 
mesure de similarity est definie pour ce type d'objets, que cette mesure de similarite est celle 
qui a ete utilisee pour construire la partition, et qu'elle verifie les 3 conditions suivantes : 

- f est une application qui a deux objets de I'ensemble de depart associe un nombre reel, 

- ce nombre reel est identique quelque soit I'ordre dans lequel on considere les deux objets, 

- le nombre reel associe a deux objets identiques est superieur au nombre reel associe a deux 
objets differents. 

Les objets sont par exemple constitues par des metadonnees, e'est-a-dire des structure 
qui regroupent un ensemble de donnees. De telles metadonnees sont par exemple des 
descriptions de prises de vue (video shots en anglais), notamment des descriptions de type 
MPEG-7. Le projet de norme MPEG-7 definit en effet un certain nombre de descripteurs pour 
prises de vue video (des descripteurs de couleur, de texture, de mouvement de camera...), et 
propose des mesures de similarite associees a ces descripteurs. Pour plus de details on se 



reportera'aux document ISO/IEC JTC1/SC29/WG11 N3521 Quillet 2000) intitule « Coding of 
moving pictures and associated audio information » qui renvoie au document « Visual Working 
draft » version 4.0. 

5 Breve description des dessins 

L'invention sera mieux comprise et d'autres details apparaitront dans la description qui 
va suivre en regard des dessins annexes qui sont donnes a titre d'exemples non limitatifs et 
dans lesquels : 

- la figure 1 est un schema en blocs decrivant le fonctionnement d'un exemple de precede de 
10 partition d'un ensemble d'objets, qui fournit une partition a plusieurs niveaux susceptible d'etre 

utilisee par un procede de recherche selon l'invention, 

- la figure 2 est un schema d'un exemple de structure arborescente utilisee pour mettre en 
oeuvre un procede de recherche selon l'invention, 

- la figure 3 est un schema en blocs decrivant le fonctionnement d'un exemple de procede de 
15 recherche selon l'invention, 

- la figure 4 est un schema d'un exemple d'equipement selon l'invention, 

- la figure 5 est un schema d'un exemple de systeme de transmission selon l'invention. 

Description d'un mode de realisation preferentiel 
20 Sur la figure 1 on a represents un schema en blocs decrivant le fonctionnement d'un 

exemple de procede de partition multi-niveaux destine a fournir une partition a plusieurs niveaux 
du type utilise par un procede de recherche selon l'invention. 

Le procede de partition de la figure 1 comporte les etapes suivantes : 

(550) : Une partition initiate PZo est definie. Cette partition comporte une classe Co, 0 qui contient 
25 tous les objets de I'ensemble X. 

(551) : Une partition PZj est creee pour chaque classe Cj-i, k (k=l, Qj-0 de la partition PZj-iqui 
contient plus d'un objet. Cette partition comporte Qj classes Cj 4 , C if2 , ■ -, C m . 

(552) : Un element representatif R jt i, R ji2f Rj,Qj est determine pour chaque classe C j;1 , q, 2/ 
Cj,Qj de la partition PZj. 

30 (SS3) : Ces elements representatifs sont stockes dans une structure arborescente TR de telle 

sorte que chaque element representatif R j( i, R j/2 , Rj,Qj soit un fits de I'element representatif de 
la classe Cj-i, k - 

(SS4) : Les etapes (SSI), (SS2) et (SS3) sont repetees jusqu'a ce que la partition PZj verifie un 
critere predetermine. 

35 (SS5) : Lorsque le critere predetermine est verifie, les objets des classes C jA , q, 2 , Cj (Qj sont 
stockes de facon a constituer les feuilles des nceuds R j( i, R ji2/ Rj lQ j respectivement. 

A I'etape (SSI), on peut par exemple utiliser une methode de partition du type « K- 
Means » tel que decrit dans I'article « An efficient K-means clustering algorithm » de K.AIsabti, 
S. Ranka et V. Singh, publie a I'occasion du « IPPS/SPDP Worshop on High Performance Data 



Mining, 1998, Orlando, Florida ». On peut aussi utiliser une methode de partition hierarchique 
par agglomeration telle que decrit dans Introduction du brevet americain precite, ou encore une 
combinaison des deux methodes, une methode part agglomeration etant utilisee pour initialiser 
une methode de type « K-Means ». 

L'element representatif d'une classe est par exemple le centroide de la classe. Pour 
determiner le centroide d'une classe, on calcule d'abord un element fictif qui presente une 
meme similarity avec tous les elements de la classe. Le centroide est constitue par l'element de 
la classe qui est le plus proche de cet element fictif. 

Le procede de partition multi-niveaux se termine (c'est-a-dire que la condition 
predeterminee est consideree comme verifiee) soit lorsque le nombre d'objets par classe est le 
plus proche possible d'une valeur maximum, soit lorsque les objets contenus dans les classes de 
la partition PZj sont suffisamment proches du centroide de la classe. 

Sur la figure 2 on a represente un exemple de structure arborescente TR obtenue avec 
un tel procede de partition multi-niveaux et susceptible d'etre utilisee pour mettre en ceuvre un 
procede de recherche selon I'invention. Les nceuds de I'arbre sont representes en pointilles. lis 
contiennent un element representatif d'une classe de I'ensemble d'objets. Les feuilles de I'arbre 
sont representees en traits pleins. Elles contiennent les objets x u x N de I'ensemble X. 

Sur la figure 3, on a represente un schema en blocs decrivant le fonctionnement d'un 
exemple de procede de recherche selon I'invention pour selectionner un nombre predetermine 
d'objets N dans une structure arborescente Y. D'apres la figure 3, un procede de recherche 
selon I'invention comporte les etapes suivantes : 

- (TO) : Une variable NBO, qui indique le nombre de feuilles qu'il reste a selectionner, est 
initialisee. Sa valeur initiale est egale au nombre predetermine d'objets a selectionner NBO=n. 

- (Tl) : Le nombre de feuilles NBL(n) qui dependent du nceud courant n est determine. Les 
feuilles qui dependent d'un nceud sont les feuilles de ce noeud, ainsi que les feuilles des nceuds 
qui dependent de ce nceud. 

- (T2) : Le nombre de feuilles qui dependent du noeud courant NBL(n) est compare au nombre 
de feuilles qu'il reste a selectionner NBO. 

- (T3) : S'il sont egaux (NBL(n)=NBO), les feuilles qui dependent du nceud courant n sont 
selectionnees (cette operation de selection est notee S(n, x k ) sur la figure 3). Et le procede se 
termine. 

- (T4.0) : Si le nombre de feuilles NBL(n) est inferieur au nombre de feuilles qu'il reste a 
selectionner (NBL(n)<NBO), les feuilles qui dependent du nceud courant n sont selectionnees 
(S(n, x k )). 

- (T4.1) : La variable NBO qui indique le nombre de feuilles qu'il reste a selectionner est mise a 
jour en soustrayant le nombre de feuilles NBL(n) au nombre courant de feuilles qu'il reste a 
selectionner : NBO=NBO-NBL(n). 

- (T4.2) Le frere du nceud courant qui est le plus proche de I'exemple, note NTEB(n), devient le 
nouveau nceud courant : n=NTEB(n), et I'etape (Tl) est reiteree. 
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- (T5) : Si le nombre de feuilles NBL(n) est superieur au nombre de feuilles qu'il reste a 
selectionner (NBL(n)>NBO), le fits du noeud courant qui est le plus proche de I'exemple, note 
NTEC(n), devient le nouveau noeud courant : n=NTEC(n), et I'etape (Tl) est reiteree. 

De facon avantageuse, le nombre d'objets a selectionner NBO est fixe egal a un multiple 
5 du nombre de resultats NBR souhaites par I'utilisateur : NBO=a.NBR. Dans ce cas le procede de 
recherche selon I'invention comporte une etape supplementaire (T6) pour ne retenir parmi les 
a. NBR objets selectionnes que les NBR objets les plus proches de I'exemple recherche. Par 
exemple, cette selection supplementaire effectuee a I'etape (T6) consiste en une comparaison 
systematique des a. NBR objets contenus dans les feuilles selectionnees avec I'exemple 
10 recherche. 

La proximite de deux objets est evaluee en utilisant une mesure de similarite f qui 
depend du type d'objets en cause, qui est celle qui a ete utilisee pour construire la structure 
arborescente, et qui reppnd aux trois conditions suivantes : 

- f est une application qui a deux objets de I'ensemble de depart associe un nombre reel, 

15 - ce nombre reel est identique quelque soit I'ordre dans lequel on considere les deux objets, 

- le nombre reel associe a deux objets identiques est superieur au nombre reel associe a deux 
objets differents. 

L'invention s'applique notamment a des objets qui sont des instances de descripteurs ■ 
definis dans le projet de norme MPEG-7, en utilisant les mesures de similarites associees qui 

20 sont prposees dans ce projet de norme MPEG-7. 

Sur la figure 4 on a represents un exemple d'un equipement selon l'invention. Cet 
equipement est une camera 1 qui comporte des moyens 2 de capture de video (par exemple de 
type CCD). La camera 1 comporte egalement une memoire 3 pour stocker des donnees et une 
memoire 4 pour stocker des programmes d'ordinateur, un ensemble a microprocesseurs 5 pour 

25 executer lesdits programmes, et une interface utilisateur 6 pour recevoir des commandes 
passees par I'utilisateur et pour fournir des donnees a I'utilisateur. La memoire 4 contient 
notamment un ensemble PG1 d'un ou plusieurs programmes pour coder la video capturee. Cet 
ensemble de programmes PG1 delivre notamment des descriptions de prises de vue de type 
MPEG-7 qui sont stockees dans la memoire 3. La memoire 4 contient egalement : 

30 - un programme PG2 de partition multi-niveaux d'un ensemble compose de plusieurs desdites 
descriptions MPEG-7, 

- un programme PG4 selon l'invention de recherche dans une structure arborescente contenant 
lesdites descriptions. 

Sur la figure 5 on a represents un schema d'un exemple de systeme de transmission 
selon l'invention. Un tel systeme comporte une source de donnee 10, un equipement utilisateur 
20, et un media 30 pour transporter des signaux entre la source de donnees 10 et I'equipement 
utilisateur 20. La source de donnees 10 est par exemple une source de donnees video. Le media 
de transmission qui transmet ces donnees video a I'equipement utilisateur est par exemple 
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constitue par un reseau cable, un reseau de transmission par satellite, une liaison radio... 
L'equipement utilisateur comporte un circuit de reception 100 servant notamment a recevoir des 
donnees transmises par la source 10, une memoire 110 pour stacker des donnees, notamment 
des donnees regues, une memoire 120 qui contient des programmes d'ordinateur, un ensemble 
a microprocesseurs 140 pour executer lesdits programmes, et une interface utilisateur 160 pour 
recevoir des commandes passees par I'utilisateur et pour fournir des donnees a I'utilisateur. La 
memoire 120 contient notamment un programme PG5 pour elaborer a partir des donnees video 
regues une base de donnees d'objets qui sont des descriptions MPEG-7 relatives a des prises de 
vue. Elle contient egalement un programme PG2 de partition multi-niveaux d'un ensemble 
comportant des objets de cette base de donnees, et un programme PG4 selon I'invention de 
recherche d'objets dans une structure arborescente contenant lesdites descriptions. 



7 

REVENDICATIONS 

1. Procede de recherche, dans un ensemble d'objets, d'un nombre predetermine d'objets les 
plus proches d'un exemple, en utilisant une partition a plusieurs niveaux qui a une structure 
arborescente comportant des noeuds et des feuilles, les noeuds contenant des elements 
representatifs de classes d'objets, et les feuilles contenant des objets, ledit procede consistant a 
5 executer les etapes suivantes de facon iterative : 

- une etape de parcours de ladite structure arborescente a partir d'un nceud, vers des feuilles, 
en passant par les nceuds dont les elements representatifs sont les plus proches de I'exemple, 
pour selectionner une ou plusieurs feuilles contenant un ou plusieurs objets, 

- une etape de test pour verifier si le nombre de feuilles selectionnees est inferieur audit nombre 
10 predetermine d'objets, 

- et, si le nombre de feuilles selectionnees est inferieur audit nombre predetermine d'objets, une 
nouvelle iteration desdites etapes, a partir du nceud frere du dernier nceud parcouru, le plus 
proche dudit exemple. 

15 2. Procede de recherche selon la revendication 1, caracterise en ce que le nombre 

predetermine d'objets est un multiple d'un nombre predetermine de resultats, et ledit procede 
comportant une etape supplemental de selection pour ne retenir, parmi les feuilles 
selectionnees, qu'un nombre de feuilles egal audit nombre predetermine de resultats, les feuilles 
retenues etant celles qui contiennent les objets les plus proches dudit I'exemple. 

20 

3. Procede de recherche selon la revendication 1, caracterise en ce que I'etape de parcours de 
la structure arborescente comporte un test pour verifier, pour chaque nceud parcouru, si le 
nombre de feuilles rattachees a ce nceud est inferieur ou egal au nombre d'objets a 
selectionner, auquel cas les feuilles rattachees a ce nceud sont selectionnes directement, sans 

25 passer par d'eventuels nceuds intermediates. 

4. Procede de recherche selon I'une des revendications 1 ou 2, caracterise en ce que lesdits 
objets sont des descriptions de prises de vue. 

30 5. Procede de recherche selon I'une des revendications 1 ou 2, caracterise en ce que lesdits 
objets sont des descriptions de type MPEG-7. 

6. Procede de recherche selon la revendication 1, caracterise en ce que la proximite des 
elements representatifs, ou des objets, avec I'exemple recherche est determinee en utilisant une 
35 mesure de similarite f qui est celle qui a servi a construire la partition utilisee, et qui verifie les 
proprietes suivantes : 

- f est une application qui, a deux donnees de I'ensemble de depart, associe un nombre reel, 



'FEOsf * ~ * v.'- '-s-r 




8 



- ce nombre reel est identique quelque soit I'ordre des deux donnees, 

- le nombre reel associe a deux donnees identiques est superieur au nombre reel associe a deux 
donnees differentes. 

5 7. Programme d'ordinateur comportant des moyens pour la mise en oeuvre d'un procede de 
recherche selon I'une des revendications 1 ou 2. 

8. Equipement comportant des moyens de mise en ceuvre d'un procede de recherche selon 
I'une des revendications 1 ou 2. 

10 

9. Systeme de transmission comportant au moins un equipement selon la revendication 8. 
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ce nombre reel est identique quelque soit I'ordre des deux donnees, 

- le nombre reel associe a deux donnees identiques est superieur au nombre reel associe a deux 
donnees differentes. 

7. Programme comportant des instructions de code de programme pour I'execution des etapes d'un 
procede selon I'une des revendications 1 ou 2 lorsque ledit programme est execute par un processeur. 

8. Equipement comportant des moyens de mise en ceuvre d'un procede de recherche selon I'une 
des revendications 1 ou 2. 

9. Systeme de transmission comportant au moins un equipement selon la revendication 8. 
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